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摘要 : [目的 /意义 | Springer Nature SciGraph 平台 提供 的 关联 开放 数据 的 分 析 ， 为 国内 出 


版 商 在 学 术 交 流 和 语义 出 版 中 使 用 关联 数据 促进 科研 的 关联 开放 实践 提供 参 
国 开放 科研 运动 的 进一步 向 前 发 展 。 [方法 /过 程 ] 对 Springer Nature SciGraph 平台 发 布 的 实 


考 ， 可 推动 我 


体 对 象 、 条 用 的 词 表 、 数 据 模 型 进行 详细 分 析 。 [结果 /结论 ] Springer Nature SciGraph 通过 


构建 自己 的 本 体 ， 条 用 一 种 用 于 RDF 的 更 简单 的 序列 化 N-Triples 格式 的 三 元 组 对 数据 进 


行 表示 ， 作 为 世界 上 最 大 的 出 版 商 之 一 ，Springer Nature 关联 数据 在 今后 必 将 为 其 他 出 版 商 


要 实现 科研 关联 开放 提供 一 定 的 借鉴 。 
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1 引言 


关联 数据 作为 一 种 最 佳 的 语义 网 实践 ， 从 2006 年 提 


出 至 今 十 多 年 的 时 间 ， 经 历 了 从 最 


简单 的 知识 库 与 词汇 表 到 不 用 领域 的 应 用 。L. Jens. A. Sören, C. Sarven 等 在 2017 年 第 10 
届 LDOW (Linked data on the Web) 会 议 上 对 关联 数据 在 过 去 十 年 的 的 发 展 进行 了 总 结 ， 

并 指出 在 未 来 的 十 年 ， 关 联 数据 在 学 术 交 流 中 将 发 挥 较 大 的 作用 外， 且 此 次 会 议 提出 “ 开 
创 关 联 开放 科研 知识 云 (pioneering the linked open research cloud) ”3 的 新 型 倡议 ， 鼓 励 学 
者 将 关联 数据 技术 与 最 佳 实践 应 用 于 学 术 交 流 中 。C. Sarven 等 提出 关联 开放 原则 (linked 


research priciple) 以 鼓励 关联 科研 知识 的 开放 钙 。ScholarlyData.org 中 利 月 
9 对 语义 网 会 议 相 关 的 论文 、 人 员 、 组 织 和 事件 进行 了 组 织 。 欧 盟 、 美 国 
政府 等 在 2013 年 成 立国 际 研究 数据 联盟 (Research Data Alliance) 四， 利 
促进 科研 数据 的 共享 与 交换 ， 通 过 科研 数据 转换 平台 (research data switchboard) 与 科研 攻 
W (research graph) 项 目 实现 了 连接 科研 人 员 、 出 版 物 、 研 究 资助 和 和 下 


上 


据 ) 的 功能 。Springer Nature 为 帮助 科研 共同 体 充 分 利 


SciGraph 关联 开放 数据 平台 外， 集成 了 Springer Nature 及 


会 议 本 体 数据 模型 
政府 和 澳大利亚 


数据 标准 和 实践 


究 数 据 集 (研究 数 


开放 科研 所 带 来 的 便利 ， 新 推出 
其 合作 伙伴 的 数据 资源 ， 如 有 关 科 


研 资助 机 构 、 科 研 项 目 及 拨款 、 会 议 、 科 研 单位 和 出 版 物 的 信息 ， 让 分 析 Springer Nature 


出 版 物 的 相关 信息 变 得 更 加 容易 ， 目 前 ， 该 平台 包含 了 1.55 亿 条 学 术 界 关注 对 象 的 信息 
三 元 组 ) 。 更 多 的 数据 ， 如 引用 、 专 利 、 临 床 试验 和 使 用 数量 等 ， 也 将 分 阶段 推出 


这 


样 到 2017 年 底 ，Springer Nature SciGraph 的 三 元 组 数量 将 增 至 10 (ZALES), 


本 文 以 Springer Nature SciGraph 平台 提供 的 关联 开放 数据 为 有 


究 对 象 ， 对 其 发 布 的 实 


体 对 象 、 采 用 的 本 体 和 词 表 、 数 据 模型 进行 分 析 ， 由 在 为 国内 在 学 术 交 流 和 开放 科研 中 使 


用 关联 数据 提供 参考 ， 促 进 国内 科研 数据 的 语义 化 、 国 


际 化 共享 和 开放 科 和 看 


运动 的 进一步 


向 前 发 展 。 


2 Springer Nature SciGraph 的 实体 对 象 分 析 

Springer Nature 的 关联 开放 数据 中 分 了 主体 (agent) 、 资 产 Casset) 、 概 念 
(concept) 、 事 件 〈event) 四 大 类 ， 其 中 概念 和 事件 类 中 包括 的 实体 是 Springer Nature 发 
布 的 重点 。 概 念 的 下 一 层 分 类 包括 : 注释 、 合 同 、 出 版 物 、 类 型 ， 注 释 的 子 类 主要 是 引文 
计量 类 ， 合 同 的 子 类 是 资助 类 ， 出 版 物 的 子 类 包括 产品 (产品 指 Springer Nature 对 外 提供 
的 文章 、 图 书 、 书 的 章节 、 期 刊 ) 和 作品 《专著 、 连 续 出 版 物 ) ， 类 型 包括 主题 、 获 取 类 
型 、 文 章 类 型 、 会 议 系列 、 产 品 市 场 编号 、 出 版 物 状态 子 类 。 事 件 的 下 一 层 分 类 包括 : R 
BEIA REFA ERFAR AK RRE BRES. FA (thing) 类 是 所 有 类 的 
上 位 类 。 

在 发 布 关 联 数据 之 前 ， 需 要 明确 竺 发布 的 数据 中 实体 类 型 及 实体 间 的 关系 。 遵 循 关联 
数据 发 布 原则 第 一 条 ， 即 用 URI 作为 任何 资源 的 名 称 ， 确 保 资源 的 可 获取 性 。Springer 
NatureSciGraph 的 URI 主 要 有 了 两 种 模式 : 

http://www.springernature.com/scigraph/things/ {datasets}/{scigraphId} 


http://www.springernature.com/scigraph/things/ {datasets }/ {topic} 

这 两 种 模式 是 一 样 的 ， 第 二 种 模式 主要 是 针对 主题 类 实体 对 象 的 。 首 先 以 
http://www.springernature.com/scigraph/ 作 为 基地 址 ， 该 地 址 作为 Springer NatureSciGraph X 
联 开放 数据 的 发 布 平 台 。“thing” 类 是 所 有 类 的 上 位 类 。“ datasets” 为 各 类 实体 组 成 的 数据 
集 ， 其 属 性 值 可 以 有 
articles. grants, journals, journalbrands, subjects. contributions. books 等 ， 必 须 指 定数 据 
集 才能 访问 其 中 的 对 象 。 对 象 集 后 必须 有 相应 的 对 象 ，URI 中 用 “scigraphId” 或 “topic” 表 
示 ， 和 否则 无 法 找到 对 象 。 
目前 Springer Nature 已 发 布 的 关联 开放 数据 中 实体 类 型 有 文章 、 期 刊 、 主 题 、 资 助 ， 
各 数据 对 应 的 URI 如 表 1 所 示 。 


表 1 实体 对 象 的 URI 


实体 对 象 URI 

article (文章 ) _http://www.springernature.com/scigraph/things/articles/{scigraphId} 
概 aa al CH http://www.springernature.com/scigraph/things/journals/{scigraphId} 
念 subject (=E . . . 

Bi) ~ http://www.springernature.com/scigraph/things/subjects/ {topic} 

we 

grant (资助 ) http://www.springernature.com/scigraph/things/grants/{scigraphId} 

HAKAAN: 


主题 URI: http:/www.springernature.com/scigraph/things/subjects/geology (在 Springer 


Nature 中 的 主题 词 geology) 

期 刊 URI: 
http://www.springernature.com/scigraph/things/journals/042783d5f9e6e3813522bS5ebbe89f4ab 

Springer Nature 不 仅 为 数据 建立 了 有 效 、 唯 一 的 URI， 还 建立 了 一 个 SciGraphcore 
ontology (AAI: sg) 本 体 ， 这 个 本 体 由 45 个 类 和 206 个 属性 组 成 ， 拥 有 自己 的 命名 空间 

Chttp:Wwww.springernature.comy/scigraph/ontologies/core/， 前 绥 sg :)。 在 概念 上 ， 这 个 本 体 

是 以 前 的 nature.com 核心 本 体 中 的 延伸 。 构 建 这 个 本 体 的 原因 一 是 由 于 在 其 他 本 体 或 词汇 
表 中 找 不 到 相应 的 词汇 来 描述 某 些 数据 或 属性 ， 二 是 符合 本 模型 特色 的 类 和 属性 ， 可 以 使 
Springer Nature 在 更 好 描述 数据 的 同时 被 外 界 更 好 地 引用 。 并 与 外 部 的 全 球 研究 标识 符 数 
HÆ (Global research identifier database, GRID) 中 、 澳 大 利 亚 与 新 西 兰 标 准 研究 分 类 法 : 


gaw 


研究 领域 ( Australian and New Zealand standard research classification: fields of 
research, ANZSRC-FOR) "I, DOIE T E42.» 

澳大利亚 与 新 西 兰 标准 研究 分 类 法 : 研究 领域 (ANZSRC-FOR) 是 根据 研发 过 程 中 所 
用 的 方法 对 研发 活动 进行 分 类 ， 而 不 是 根据 研发 单位 或 者 研发 目的 进行 分 类 。 ANZSRC- 
FOR 分 类 法 中 的 类 别 包 括 由 企业 、 大 学 、 高 等 学 校 、 国 立 科 研 机 构 和 其 他 组 织 研究 探讨 的 
主要 研究 领域 及 相关 子 领域 和 新 型 领域 。 

全 球 研究 标识 符 数 据 库 (Global research identifier database, GRID) 不 仅 提供 有 关 组 织 
的 ID 和 名 称 ， 而 且 提 供 了 数据 类 型 、 等 级 结构 、 所 处 位 置 等 元 数据 ， 与 
GeoNames、WikiData、CrossRef、 开 放 资 助 者 注册 表 、 国 际 标准 名 称 标识 符 (international 
standard name identifier ，ISNI) 等 实现 链接 ， 扩 充 了 元 数据 。 


3Springer Nature SciGraph 词 表 

关联 数据 的 发 布 原则 第 三 条 是 尽 可 能 复 用 已 有 的 、 成 熟 的 词 表 来 描述 资源 ， 用 以 提高 
词汇 表 的 互 操作 性 ， 减 少 对 本 地 词汇 的 管理 。Springer Nature SciGraph 所 用 的 词汇 表 主要 
分 为 通用 词 表 和 专用 词 表 两 类 〈 如 表 2 所 示 ) ， 其 中 通用 词汇 表 主 要 用 于 描述 实体 的 一 般 
属性 ， 如 实体 类 型 、 实 体 类 型 之 间 的 关系 等 ， 专 用 词 表 用 以 描述 具体 实体 ， 并 具有 所 描述 
实体 的 属性 。 可 看 出 ，Springer NatureSciGraph 用 复 用 通用 的 词汇 表 来 描述 实体 的 类 型 、 
RDF 数据 的 元 数据 〈VoIDI9) 、 注 释 所 用 的 词汇 等 ， 使 用 的 专用 词汇 表 只 有 SKOS 和 自 建 
的 本 体 SciGraph Core Ontology， 并 未 复 用 其 他 词汇 表 对 资源 进行 描述 ， 但 是 Springer 


Nature $E Y $ bibo", crm (conceptual reference model) "4、depedial'"1、depedia -owl 、 


dc 、 dcterms 、 event 、 fabio ( the FRBR-aligned bibliographic ontology ) 


181 foaf、 mesh ( medical subject headings ) 09 、 obo ( open biomedical ontologies ) 


2) ~ prism ( publishing requirements for industry standard metadata ) 


“Il schema, skos, veard’*!, vivo (integrated semantic framework) P, wd (wikidata) %*! 


本 体 之 间 的 映射 ， 其 中 与 dbpedia、mesh、wd 是 主题 词 之 间 的 映射 ， 其 他 是 类 和 属性 之 间 
的 映射 。 
可 看 出 ，SciGraph Core Ontology 所 描述 类 和 属性 比较 全 面 ， 虽 然 未 复 用 已 有 成 熟 词 表 ， 

但 是 使 用 根据 自身 需求 建立 的 本 体 可 以 更 准确 地 描述 相关 的 类 和 属性 。 
表 2 词 表 及 注释 


gaw 


x] 2 语言 ， 用 以 在 万 维 网 中 发 布 和 共享 

OWL (Web ontology language ) 网 络 本 体 语言 ， 用 以 在 万 维 网 中 发 布 和 共 这 
源 i EHN, 一 种 通过 “了 JE” 三 元 

RDF (resource description framework ) a Web 资 us 的 


RDFS ( resource description framework | 是 RDF 词汇 表 的 扩展 词汇 表 ， 为 RDF 数据 
schema ) 


Dcterms (DCMI metadata terms ) 汇 表 的 扩展 词汇 


DC (Dublin core) 者 


Vann (a vocabulary for annotating 通过 用 例 和 使 用 
vocabulary descriptions ) 释 的 词汇 表 


VoID (vocabulary of interlinked datasets ) | | RDF 数据 的 元 数据 进行 描述 


专用 | SKOS ( simple knowledge organization | 用 以 对 受 控 词 表 中 词汇 进行 描述 的 知识 组 织 
词 表 | System) 系统 词汇 表 


Springer Nature 自己 构建 的 本 体 ， 用 以 描述 
Springer Nature 网 站 提供 的 资源 


sg (SciGraph Core Ontology) 


4 Springer Nature SciGraph 数据 模型 分 析 

目前 Springer Nature 发 布 的 关联 开放 数据 中 实体 类 型 有 文章 、 期 刊 、 主 题 、 资 助 者 ， 
这 些 数据 之 间 的 关系 模型 如 图 1 所 示 外 ， 文 章 通过 sg:hasJournal、sg:hasSubject 分 别 与 期 二 
和 主题 进行 链接 ， 资 助 实体 通过 sg:hasFundedPublication 与 文章 进行 链接 ， 如 图 2 所 示 。 本 
文 将 这 个 数据 模型 进行 拆 分 并 分 别 进行 分 析 。 
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图 1SciGraph 数据 模型 


图 2 文章 数据 模型 
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4.1 文章 数据 模型 

Springer Nature 为 文章 类 数据 模型 提供 了 20 个 属性 ， 将 20 个 属性 分 为 类 型 、 标 识 符 、 
标签 、 贡 献 者 、 出 版 商 、 主 题 信息 、 来 源 6 类 。 使 用 rdf:type 表示 类 型 ， 标 识 符 属性 包括 : 
scigraphId、 数 字 对 象 标识 符 (digital object identifier，DOI)〉 和 数字 对 象 标 识 符 链 接 ; 标签 
属性 包括 : 语种 、 题 名 、 翻 译 题名 、 摘 要 、 翻 译 摘 要 ; 出 版 商 信息 包括 : 出 版 年 、 出 版 年 
月 、 出 版 日 期 、Springer Nature 网 页 ， 主 题 信息 包括 澳大利亚 与 新 西 兰 标准 研究 分 类 法 : 
研究 领域 (ANZSRC-FOR) 00 和 Springer Nature 自己 建立 的 主题 词 ， 来源 信息 包括 期 刊 、 
期 刊 卷 、 期 刊 期 号 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提供 的 贡献 者 、 资 助 数据 、 期 刊 、 主 题词 类 对 
应 的 实例 URI 进 行内 部 链接 ， 选 用 数字 对 象 标识 符 系统 提供 的 DOILINK 和 ANZSRC-FOR 
提供 的 分 类 号 作为 外 部 链接 ， 其 他 属性 值 取 值 为 文本 值 或 数值 ， 见 图 2。 

Springer Nature 目前 并 没有 贡献 者 (contribution ) 的 数据 模型 。 但 是 从 其 发 布 的 N- 
Triplesc3 格 式 的 三 元 组 数据 ， 可 知 贡献 者 属性 有 数据 类 型 、scigraphId、 对 外 公开 的 姓名 、 
对 外 公开 的 姓 、 对 外 公开 的 名 、 排 序 〈 文 章 作者 排序 ) 、 是 否 为 通讯 作者 《属性 值 为 布尔 
A true BY false) . fat CHEX “authoreditor’=% “principal investigator”) ~ JE NLP 
CW Springer Nature 提供 的 实体 ) PR9。 

4.2 资助 数据 模型 

Springer Nature 为 资助 类 数据 模型 提供 了 18 个 属性 ， 将 18 个 属性 分 为 类 型 、 标 识 符 、 
标签 、 资 助 额 、 资 助 时 间 、 资 助 主 体 、 其 他 6 类 。 使 用 rdfitype 表示 类 型 ， 标 识 符 属 性 为 资 
助 的 scigraphld; 标签 属性 包括 : 语种 、 题 名 、 翻 译 题 名 、 摘 要 、 翻 译 摘要 ， 资 助 额 信息 包 
括 : 资助 金额 、 融 资 货币 ;资助 时 间 包括 资助 开始 时 间 、 资 助 结束 时 间 ; 资助 主体 包括 资 
助 组 织 、 被 资助 组 织 ， 其 他 属性 包括 与 资助 相关 的 贡献 者 、 资 助 的 研究 领域 分 类 号 、 资 助 
的 出 版 物 、 许 可 条 款 、 所 在 网 页 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提供 的 与 资助 相关 的 贡献 者 、 资 助 的 出 版 物 文 
章 对 应 的 实例 URI 进行 内 部 链接 ， 选 用 全 球 研究 标识 符 数据 库 global research identifier 
database, GRID) 10 提供 资助 组 织 与 被 资助 组 织 URI 和 ANZSRC-FOR 提供 的 分 类 号 作为 
外 部 链接 ， 其 他 属性 取 值 为 文本 值 或 数值 ， 如 图 3 所 示 : 


~ 


图 3 资助 数据 模型 


4.3 期 刊 数据 模型 

Springer Nature 为 期 刊 类 数据 模型 提供 了 8 个 属性 ， 将 8 个 属性 分 为 类 型 、 标 识 符 、 所 
属 期 刊 品 牌 、 格 式 、 是 否 为 正在 出 版 、 是 否 为 历史 期 刊 6 类 。 使 用 rdf:type 表示 类 型 ， 标 识 
符 属性 包括 为 期 刊 的 scigraphId、ISSN 号 、DOI; 使 用 sg:hasJournalBrand 表示 所 属 期 刊 品 
牌 ， 格 式 主要 指 期 刊 的 媒介 形式 ; 是 否 为 正在 出 版 用 sg:isActivePublication 属性 表示 ; 是 否 
有 历史 期 刊 用 sg:isHistoricalJourna 表示 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提供 的 与 期 刊 所 属 的 期 刊 品牌 、 出 版 在 期 刊 上 
的 文章 对 应 的 实例 URI 进 行内 部 链接 ， 其 他 属性 取 值 为 文本 值 或 数值 ， 其 中 期 刊 的 媒介 属 
性 文本 取 值 为 “Electronic” 和 “Paper (journals, normal index)”，“ 是 否 为 正在 出 版 期 刊 ” 和 
“是 否 为 历史 期 刊 ”属性 取 值 均 为 为 布尔 值 “true”" 或 “false"”， 见 图 4。 

从 Springer Nature 提供 的 期 刊 数据 模型 的 N-Triples 格式 的 三 元 组 数据 可 知 ， 期 刊 品牌 
属性 有 数据 类 型 、scigraphId、 语 种 、 标 题 、 标 题 简称 、 副 标题 、 版 本 说 明 、 出 版 商 、 知 识 
产权 所 有 者 、 所 在 网 页 、 添 加 Springer Nature 数据 库 的 日 期 、 创 建 年 代 、 结 束 年 代 、 开 始 
卷 号 、 结 束 卷 号 、 卷 数 、 开 放 获 取 〈 取 值 为 “Fully Open Access" 或 “Hybrid (Open 
Choice)”) 。 
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Oo 图 4 期 刊 数据 模型 
4.4 主题 数据 模型 


Springer Nature 的 主题 主要 是 自己 网 站 建立 的 主题 词 ， 主 要 分 为 生物 科学 、 地 球 与 环 
境 科 学 、 生 命 科 学 、 物 理科 学 、 科 学 共同 体 与 社会 、 社 会 科学 、 人 文科 学 、 商 务 贸 易 、 弃 
用 的 九 大 类 主题 。Springer Nature 为 主题 数据 模型 提供 了 16 个 属性 ， 将 16 个 属性 分 为 类 型 、 
标签 、 标 识 符 、 参 照 、SKOS 表示 5 类 。 使 用 rdf:type 表示 类 型 ， 使 用 rdfs:label 表示 标签 ; 
标识 符 属性 为 主题 的 1d 号 ;参照 类 属性 包括 Springer Nature 主题 词 之 间 的 相关 关系 、 蔡 代 
KA; SKOS 表示 是 通过 SKOS 命名 空间 对 Springer Nature 主题 词 进行 组 织 表示 ， 包 括 其 首 
选 词 、 非 首选 词 、 定 义 、 注 释 、 范 围 注 释 、 主 题词 所 属 主题 词 表 、 上 下 位 关系 和 族 首 词 。 

在 各 属性 的 取 值 中 ， 与 Springer Nature 提供 的 相关 主题 词 、 替 代 主题 词 、 被 普 代 主题 
词 对 应 的 实例 URI 进行 内 部 链接 并 通过 SKOS 对 Springer Nature 的 主题 词 进行 组 织 ， 实 
现 语义 表示 ; 其 他 属性 取 值 均 为 文本 值 ， 如 图 5 所 示 : 
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5 主题 数据 模型 


5 RDF 实现 
Springer Nature SciGraph 关联 开放 数据 平台 目前 对 外 只 提供 了 N-Triples 格式 的 三 元 组 ， 
N-Triples 是 用 于 RDF 的 一 种 更 简单 的 序列 化 ， 一 种 面向 行 的 格式 。 每 个 三 元 组 必须 写成 一 
个 独立 行 ， 它 由 主语 说 明 符 、 谓 语 说 明 符 以 及 宾语 说 明 符 组 成 ， 后 面 还 有 一 个 句号 。 如 果 
它们 有 URI， 那 么 它们 用 人 尖 插 号 将 绝对 URI 引用 括 起 来 ?37。 截 取 Springer Nature SciGraph 
提供 的 有 关 主 题词 “genomics” 的 一 些 N-Triples 格式 的 代码 ， 如 图 6 Aras: 
chttp:/ /ww. springernature. com/scigraph/things/subjects/genomics> 


<ht tp: //www. w3. org/1999/02/22-rdf-syntax-ns#type> 
http://www. springernature. com/scigraph/ontologies/core/Sub ject. 


<http://www. springernature. com/scigraph/things/subjects/genomics> 
<http: //www. w3. org/2000/01/rdf-schema#l abe 1> Genomics@en . 


<http://www. springernature. com/scigraph/things/subjects/genomics> 
<http: //www. springernature. com/scigraph/ontologies/core/id> genomics 


<http://www. springernature. com/scigraph/things/subjects/genomics> 
<http://www. w3. org/2000/01/rdf-schema#isDef inedBy> 
<http://www. springernature. com/scigraph/things/sub jects/>. 


<http://www. springernature. com/scigraph/things/subjects/genomics> 


<http://www. springernature. com/scigraph/ontologies/core/webpage> 
http://www. nature. com/sub jects/genomics. 
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6 授权 许可 

授权 许可 通过 明确 发 布 和 使 用 关联 数据 过 程 中 的 各 项 法 律 问 题 ， 包 括 所 有 权 、 发 布 权 、 
使 用 权 、 收 益 权 等 ， 针 对 不 同 对 象限 定 不 同 的 权限 ， 构 建 合理 利用 关联 数据 的 保护 机 第 
以 达到 促进 数据 开放 、 保 证 开放 数据 安全 、 提 高 数据 重用 性 的 目的 。 授 开放 许可 是 语义 网 
环境 下 关联 数据 能 够 真正 开放 并 长 久 发 展 的 必要 条 件 。 授 权 许可 通过 嵌入 数据 ， 使 得 用 户 
在 访问 数据 时 无 需 征 得 数据 发 布 者 的 许可 ， 授 权 许 可 包含 了 用 户 被 许可 的 所 有 操作 和 未 被 
年 可 的 的 操作 。 目 前 已 有 的 授权 模型 有 :免费 文献 许可 协议 (GNU free documentation 
license)、 共 享 文件 许可 协议 ( common documentation license)、 知 识 共 享 许 可 协议 (creative 
commons license) 等 ， 各 个 协议 能 够 实现 对 不 同类 型 开放 数据 的 保护 。 

Springer Nature SciGraph 发 布 关联 数据 的 目的 是 为 了 将 其 科研 数据 融入 关联 数据 网 络 
中 ， 使 其 在 公共 领域 发 挥 作用 ， 因 而 选择 较为 通用 的 知识 共享 许可 协议 作为 授权 许可 协议 
Springer Nature SciGraph 中 的 数据 是 在 署名 - 非 商业 性 使 用 国际 4.0 (CC BY-NC 4.0) 授 权 模 型 
下 获取 的 中， 表示 人 允许 在 任何 媒介 以 任何 形式 复制 、 发 行 本 作品 ， 并 允许 修改 、 转 换 或 以 
本 作品 为 基础 进行 创作 ， 但 不 能 将 本 作品 用 于 商业 目的 外。 通过 dcterms: license 属性 表示 
该 知识 共享 协议 ， 属 性 值 为 https://creativecommons.org/licenses/by-nc/4.0/ 表 示 对 数据 使 用 进 
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行 授 权 。 


7 结语 


Springer Nature SciGraph 关联 开放 数据 平台 的 推出 ， 是 出 版 领域 实现 关联 开放 科研 的 

起 点 。Springer Nature SciGraph 关联 开放 数据 的 实现 ， 打 破 了 原 有 数据 组 织 结构 体系 ， 实 
现 了 数据 关联 、 互 操作 、 数 据 挖掘 等 功能 ， 从 概念 角度 对 出 版 物 进 行 描述 ， 通 过 对 
Springer Nature SciGraph 关联 开放 数据 模型 的 分 析 ， 可 知 出 版 社 作为 发 布 出 版 物 的 源头 ， 
对 出 版 进行 语义 描述 对 于 实现 数据 互 操作 、 数 据 关 联 有 着 重要 的 意义 。 我 国 出 版 领域 应 代 
鉴 这 种 科研 出 版 物 实 现 关联 开放 模式 ， 通 过 详细 分 析 中 文 出 版 物 包 含 的 实体 、 属 性 及 彼此 
之 间 的 关系 ， 选 择 合适 的 本 体 或 在 面 对 我 国 特 有 的 文献 (上 古籍、 拓片 等 ) 时 构建 自己 的 本 
体 ， 构 建 数据 模型 来 实现 中 文 出 版 物 的 语义 描述 和 语义 出 版 ， 同 时 指定 授权 许可 明确 数据 

—_ 使 用 过 程 中 的 各 项 法 律 问 题 。 当 然 实 现 过 程 离 不 开 软 件 平 台 的 使 用 ， 考 虑 到 成 本 问题 和 不 

同 出 版 社 之 间 数 据 的 互 操作 问题 ， 针 对 不 同 的 学 科 ， 考 虑 使 用 开源 软件 和 同一 学 科 下 的 出 

版 社 之 间 采 用 统一 的 数据 模型 、 统 一 的 词汇 表 来 实现 出 版 物 的 关联 开放 。 
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Analysis of Springer Nature SciGraphLinked Open Data* 
Bai Linlin'” 
'Lanzhou Library, Chinese Academy of Sciences, Lanzhou 730000 
"University of Chinese Academy of Sciences, Beijing 100049 
Abstract: [ Purpose/significance ] The analysis of thelinked open data provided by the Springer Nature 
SciGraph platform provides a reference for the domestic publishers to use the linked data to promote the practice 
of linked open research in the scholarly communication and the semantic publishing, and push forward the further 
development of the open scientific research movement. [Method/process ] This paper analyzed the entity objects, 
vocabularies and data models of the Springer Nature SciGraph platformin detail. [Result/conclusion ] Springer 
Nature SciGraph represents the data by building its own ontology and using a simpler serialized format N-Triples 
triple for RDF.As one of the world’s largest publishers, Springer Nature Linked Data will provide some references 
for other publishers to realize the linked research in the future. 
Keywords:Springer Nature SciGraphlinked open data open research 


